---
title: Mistral Parser
description: Text aus PDF-Dokumenten extrahieren
---

import { BlockInfoCard } from "@/components/ui/block-info-card"

<BlockInfoCard 
  type="mistral_parse"
  color="#000000"
  icon={true}
  iconSvg={`<svg className="block-icon"
      
      
      
      viewBox='1 0.5 24 22'
      fill='none'
      xmlns='http://www.w3.org/2000/svg'
      preserveAspectRatio='xMidYMid meet'
    >
      <g clipPath='url(#clip0_1621_58)'>
        <path d='M17.4541 0H21.8177V4.39481H17.4541V0Z' fill='black' />
        <path d='M19.6367 0H24.0003V4.39481H19.6367V0Z' fill='#F7D046' />
        <path
          d='M0 0H4.36359V4.39481H0V0ZM0 4.39481H4.36359V8.78961H0V4.39481ZM0 8.78971H4.36359V13.1845H0V8.78971ZM0 13.1845H4.36359V17.5793H0V13.1845ZM0 17.5794H4.36359V21.9742H0V17.5794Z'
          fill='black'
        />
        <path d='M2.18164 0H6.54523V4.39481H2.18164V0Z' fill='#F7D046' />
        <path
          d='M19.6362 4.39478H23.9998V8.78958H19.6362V4.39478ZM2.18164 4.39478H6.54523V8.78958H2.18164V4.39478Z'
          fill='#F2A73B'
        />
        <path d='M13.0908 4.39478H17.4544V8.78958H13.0908V4.39478Z' fill='black' />
        <path
          d='M15.2732 4.39478H19.6368V8.78958H15.2732V4.39478ZM6.5459 4.39478H10.9095V8.78958H6.5459V4.39478Z'
          fill='#F2A73B'
        />
        <path
          d='M10.9096 8.78979H15.2732V13.1846H10.9096V8.78979ZM15.2732 8.78979H19.6368V13.1846H15.2732V8.78979ZM6.5459 8.78979H10.9096V13.1846H6.5459V8.78979Z'
          fill='#EE792F'
        />
        <path d='M8.72754 13.1846H13.0911V17.5794H8.72754V13.1846Z' fill='black' />
        <path d='M10.9092 13.1846H15.2728V17.5794H10.9092V13.1846Z' fill='#EB5829' />
        <path
          d='M19.6362 8.78979H23.9998V13.1846H19.6362V8.78979ZM2.18164 8.78979H6.54523V13.1846H2.18164V8.78979Z'
          fill='#EE792F'
        />
        <path d='M17.4541 13.1846H21.8177V17.5794H17.4541V13.1846Z' fill='black' />
        <path d='M19.6367 13.1846H24.0003V17.5794H19.6367V13.1846Z' fill='#EB5829' />
        <path d='M17.4541 17.5793H21.8177V21.9742H17.4541V17.5793Z' fill='black' />
        <path d='M2.18164 13.1846H6.54523V17.5794H2.18164V13.1846Z' fill='#EB5829' />
        <path
          d='M19.6362 17.5793H23.9998V21.9742H19.6362V17.5793ZM2.18164 17.5793H6.54523V21.9742H2.18164V17.5793Z'
          fill='#EA3326'
        />
      </g>
      <defs>
        <clipPath id='clip0_1621_58'>
          <rect   fill='white' />
        </clipPath>
      </defs>
    </svg>`}
/>

{/* MANUAL-CONTENT-START:intro */}
Das Mistral Parse-Tool bietet eine leistungsstarke Möglichkeit, Inhalte aus PDF-Dokumenten mit der [Mistral OCR API](https://mistral.ai/) zu extrahieren und zu verarbeiten. Dieses Tool nutzt fortschrittliche optische Zeichenerkennung, um Text und Struktur aus PDF-Dateien präzise zu extrahieren und macht es einfach, Dokumentendaten in Ihre Agent-Workflows zu integrieren.

Mit dem Mistral Parse-Tool können Sie:

- **Text aus PDFs extrahieren**: PDF-Inhalte präzise in Text-, Markdown- oder JSON-Formate konvertieren
- **PDFs von URLs verarbeiten**: Inhalte direkt aus online gehosteten PDFs extrahieren, indem Sie deren URLs angeben
- **Dokumentstruktur beibehalten**: Formatierung, Tabellen und Layout aus den Original-PDFs bewahren
- **Bilder extrahieren**: Optional eingebettete Bilder aus den PDFs einbeziehen
- **Bestimmte Seiten auswählen**: Nur die Seiten verarbeiten, die Sie aus mehrseitigen Dokumenten benötigen

Das Mistral Parse-Tool ist besonders nützlich für Szenarien, in denen Ihre Agenten mit PDF-Inhalten arbeiten müssen, wie zum Beispiel bei der Analyse von Berichten, der Extraktion von Daten aus Formularen oder der Verarbeitung von Text aus gescannten Dokumenten. Es vereinfacht den Prozess, PDF-Inhalte für Ihre Agenten verfügbar zu machen und ermöglicht ihnen, mit Informationen aus PDFs genauso einfach zu arbeiten wie mit direkter Texteingabe.
{/* MANUAL-CONTENT-END */}

## Gebrauchsanweisung

Integrieren Sie Mistral Parse in den Workflow. Kann Text aus hochgeladenen PDF-Dokumenten oder von einer URL extrahieren. Erfordert API-Schlüssel.

## Tools

### `mistral_parser`

PDF-Dokumente mit der Mistral OCR API analysieren

#### Eingabe

| Parameter | Typ | Erforderlich | Beschreibung |
| --------- | ---- | -------- | ----------- |
| `filePath` | string | Ja | URL zu einem zu verarbeitenden PDF-Dokument |
| `fileUpload` | object | Nein | Datei-Upload-Daten von der Datei-Upload-Komponente |
| `resultType` | string | Nein | Art des geparsten Ergebnisses \(markdown, text oder json\). Standardmäßig markdown. |
| `includeImageBase64` | boolean | Nein | Base64-kodierte Bilder in die Antwort einschließen |
| `pages` | array | Nein | Bestimmte zu verarbeitende Seiten \(Array von Seitenzahlen, beginnend bei 0\) |
| `imageLimit` | number | Nein | Maximale Anzahl der aus dem PDF zu extrahierenden Bilder |
| `imageMinSize` | number | Nein | Minimale Höhe und Breite der aus dem PDF zu extrahierenden Bilder |
| `apiKey` | string | Ja | Mistral API-Schlüssel \(MISTRAL_API_KEY\) |

#### Ausgabe

| Parameter | Typ | Beschreibung |
| --------- | ---- | ----------- |
| `success` | boolean | Ob das PDF erfolgreich geparst wurde |
| `content` | string | Extrahierter Inhalt im angeforderten Format \(markdown, text oder JSON\) |
| `metadata` | object | Verarbeitungsmetadaten einschließlich jobId, fileType, pageCount und Nutzungsinformationen |

## Notizen

- Kategorie: `tools`
- Typ: `mistral_parse`
